TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)
TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
TOP 3
자치구 1인가구수
4 관악구 150745
3 강서구 104509
16 송파구 87140
자치구
강남구 7007
관악구 5366
서초구 5060
Name: count, dtype: int64
자치구
강남구 1713
용산구 1421
구로구 1372
Name: count, dtype: int64
안전벨과 CCTV의 상관관계: 0.3032
예상과 달리, CCTV와 안전벨의 상관관계가 높지 않다.
치안센터와 경찰관 수의 상관관계: 0.6500
다른 변수들과 비교했을 때 가장 높은 상관관계를 보임
자치구 술집 수
17 양천구 3094
7 금천구 3179
10 동작구 3276
자치구 술집 수
12 서대문구 3578
7 금천구 3179
14 성동구 4001
술집 수와 총 범죄 건수의 상관계수: 0.8354
다른 변수들과 비교했을 때, 가장 높은 상관관계를 보임
상관계수 분석

범죄건수 주요 변수

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택
서울시 치안 기준 군집화
상관계수가 높은 변수를 활용해서,
비슷한 치안 특성을 가진 구를 찾기위해
저희는 K-Means 클러스터링을 사용했습니다.

K-Means 클러스터링이란?
유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법
사용자가 군집 개수(K)를 정하면,
K개의 중심점을 기준으로 데이터를 그룹화하고,
각 데이터를 가장 가까운 중심점에 할당합니다.
중심점을 반복적으로 조정하며 유사한 데이터끼리 묶는 군집을 만듭니다.
서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

하지만 분석 결과는…?
